Une approche multi-vue pour l'extraction terminologique bilingue

نویسندگان

  • Raphaël Rubino
  • Georges Linarès
چکیده

This paper presents a multi-view approach for term translation spotting, based on a bilingual lexicon and comparable corpora. We propose to study different levels of representation for a term: the context, the theme and the orthography. These three approaches are studied individually and combined in order to rank translation candidates. We focus our task on French-English medical terms. Experiments on our new model show a significant improvement of the classical context-based approach, with a precision score of 80.4% for the first ranked translation candidates. MOTS-CLÉS : extraction terminologique, lexique bilingue, corpus comparable

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Approche générique pour l'extraction de relations à partir de textes

Résumé : Cet article s’intéresse à l’extraction de relations dans le contexte du web sémantique, en vue de procéder à de la construction d’ontologies aussi bien qu’à de l’annotation automatique de documents. Notre approche permet l’extraction de relations entre entités à partir de textes. Elle ne fait pas d’hypothèse sur les entités, de manière à la rendre aussi générique que possible, et à aut...

متن کامل

Une sélection multiple des structures d'optimisation dirigée par la méthode de classification K-means

Résumé. Le volume d’information contenu dans un entrepôt de données s’accroît sans cesse, augmentant de ce fait le temps d’exécution des requêtes décisionnelles. Pour y remédier, l’administrateur doit, durant la phase de conception physique de l’entrepôt, effectuer une sélection de structures d’optimisation (index, vues matérialisées ou fragmentation), puis assurer leur gestion et maintenance. ...

متن کامل

Prise en compte des "points de vue" pour l'annotation d'un processus d'extraction de connaissances à partir de données

Résumé. Dans cet article on propose une nouvelle approche qui rend explicite la notion de point de vue dans une analyse multivues issue d’un processus d’Extraction de Connaissances à partir de Données (ECD). Par point de vue, nous entendons la vision particulière d’un analyste lors de son processus ECD, vision référant à un corps de connaissances qui lui est spécifique. On cherche, d’une part, ...

متن کامل

Choix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC

Résumé. Le choix du taux d’élagage est crucial dans le but d’acquérir une terminologie de qualité à partir de corpus de spécialité. Cet article présente une étude expérimentale consistant à déterminer le taux d’élagage le plus adapté. Plusieurs mesures d’évaluation peuvent être utilisées pour déterminer ce taux tels que la précision, le rappel et le Fscore. Cette étude s’appuie sur une autre me...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011